查看原文
其他

百模大战V5:收录74个国产大模型,国产开源有进展但仍然非常弱

走向未来 走向未来 2023-08-31
   国产大模型仍然“涨势”喜人,已经达到74个(见表一),以这个速度,百模的目标指日可待!接下来需要思考的是如何评价各个大模型,以评出大模型的“百大排行榜”。另一方面,在持续增加的大模型中,北京的占有率依然保持在50%以上【见图一】,这波浪潮对北京来说,真宛若互联网浪潮那一波了!
本周新增的大模型中,有两个开源的基础大模型值得一说。
  • 一个是百川智能开放了 baichuan-7B,在多个评测中号称中文第一。

  • 另一个是智源开放了悟道天鹰的下载,也是7B参数规模的大模型。

国产大模型在开源开放的道路上走的越来越好了,但遗憾的是,目前国产大模型还继续走在吹牛的路上,好用的几个都是7B 这个规模的,这距离真正意义上的大模型(能够打好 AGI 基础的)还非常远。下一步是期待100B 以上的开源开放国产大模型。
说到这个,继续建议国家队入场,完成以下三个事情:
1. 国家主导训练一个1T(1万亿,GPT4的规模)参数规模或更大规模的国产开源开放基础模型,允许商用,最好是无限制的商用。
2. 大模型的智能水平(如认知科学或心智模型等)的评估,包括数据集和评估工具等。这个出发点是 AGI 的智力评估,类似对人的智力和专业能力的评估一样。
3. 开放符合社会主义价值观和中国公序良俗的训练数据集,包括大规模无监督的语料以及 SFT或 RLHF 的训练数据集等。
国家队搞基础模型、数据等既有助于追赶国际最高水平,同时也能够避免资源浪费,符合碳达峰碳中和的目标的。
说到 AGI,除了基础大模型之外,还需要做到以人为本,要尊重事实和知识,做到“知之为知之,不知为不知”。以人为本 AGI 则需要其他工具,比如知识图谱。这个论述此前说过多次,摘录如下“以人为本AGI=神经网络大模型 NN ⊕ 知识图谱 KG⊕ 强化学习RLHF。这里面的神经网络大模型负责理解语言,类似人的大脑【连接主义,图灵奖获得者Yoshua Bengio花书《深度学习》】;知识图谱则负责事实与知识,类似人类使用的百科全书【符号主义,王文广的珠峰书《知识图谱:认知智能理论与实战》】;强化学习负责从环境中学习,类似人类的吃一堑长一智实现进化【行为主义,Richard S. Sutton《强化学习》】。”
接下来是详细数据。首先是大模型列表,原始数据放在Github 上随时更新:https://github.com/wgwang/LLMs-In-China 。欢迎大家给 PR,给 Issue,或者评论里补充遗漏的大模型。V5版本的国产大模型观察见表一。按城市的数据统计见图一。

表一:国产大模型列表,V5版本,收录74个

序号

公司

大模型

省市

官网

1

百度

文心一言

北京

2

科大讯飞

星火

安徽合肥

3

达观数据

曹植

上海

4

阿里云

通义千问

浙江杭州

5

复旦大学

MOSS

上海

6

清华大学

ChatGLM

北京

7

华为

盘古

深圳

8

智源
悟道·天鹰AQUILA

北京

9

哈尔滨工业大学

本草

黑龙江哈尔滨

10

贝壳

BELLE

北京

11

百川智能

baichuan

北京

12

OpenBMB

CPM

北京

13

上海AI实验室

书生·浦语

上海

14

云知声

山海

北京

15

澜舟科技

孟子

北京

16

深思考人工智能

Dongni

北京

17

中科院

紫东太初

北京

18

虎博科技

TigerBot

上海

19

IDEA研究院

封神榜MindBot

广东深圳

20

微盟

WAI

上海

21

360

智脑

北京

22

度小满

轩辕

北京

23

华南理工大学
未来技术学院

扁鹊,
灵心SoulChat

广东广州

24

西北工大+华为

秦岭·翱翔

陕西西安

25

奇点智源

Singularity
OpenAPI

北京

26

超对称技术公司

乾元

北京

27

稀宇科技

MiniMax

上海

28

西湖心辰

西湖

浙江杭州

29

晓多科技+国
家超算成都中心

晓模型XPT

四川成都

30

中科闻歌

雅意

北京

31

北京语言大学

桃李

北京

32

商汤科技

日日新

上海

33

国家超级
计算天津中心

天河天元

天津

34

星环科技

无涯、求索

上海

35

慧言科技
天津大学

海河·谛听

天津

36

宇视科技

梧桐

浙江杭州

37

电信智科

星河

北京

38

左手医生

左医GPT

北京

39

智慧眼

砭石

湖南长沙

40

好未来

MathGPT

北京

41

数慧时空

长城

北京

42

理想科技

大道Dao

北京

43

硅基智能

炎帝

江苏南京

44

中工互联

智工

北京

45

创业黑马

天启

北京

46

追一科技

博文Bowen

广东深圳

47

网易有道

子曰

北京

48

网易伏羲

玉言

广东广州

49

昆仑万维

天工

北京

50

知乎

知海图

北京

51

医疗算网

Uni-talk

上海

52

孩子王

KidsGPT

江苏南京

53

中科创达

魔方Rubik

北京

54

腾讯

混元

广东深圳

55

拓尔思

拓天TRSGPT

北京

56

乐言科技

乐言

上海

57

清博智能

先问

北京

58

智子引擎

元乘象

江苏南京

59

拓世科技

拓世

江西南昌

60

循环智能

盘古

北京

61

印象笔记

大象GPT

北京

62

第四范式

式说

北京

63

字节跳动

Grace

北京

64

出门问问

序列猴子

北京

65

数说故事

SocialGPT

广东广州

66

云从科技

从容

广东广州

67

电科太极

小可

北京

68

中国农业银行

小数ChatABC

北京

69

麒麟合盛

天燕AiLMe

北京

70

台智云

福尔摩斯FFM

台湾

71

医联科技

medGPT

四川成都

72

理想汽车

MindGPT

北京

73

港中文深圳

华佗GPT

广东深圳

74

长虹

长虹超脑

四川绵阳


图一:国产大模型按省级单位统计,北京依旧占半壁江山,沪粤紧随其后,苏浙平分秋色

本文依然是《迈向以人为本通用人工智能》的一份子,其他内容诸如:

开源大模型观察之LLaMA

ChatGPT不仅把律师带入悬崖,还给“他爸”带来了麻烦

大模型时代,AI原生启航

被ChatGPT带入悬崖的律师

知识图谱和大模型在全球供应链体系数字化中的应用:上海国际物流节发言总结和补充

语言≠知识:万字长文看语言通天塔的建成和神经网络大模型的固有缺陷——与Bing Chat关于苏东坡的对话实录

整理材料不易,请随手点赞、关注、转发、在看、打赏!

         
         
        

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存